查看原文
其他

【科技评论】人工智能的未来

2014-07-28 战略前沿技术

导读 :本文为神州数码首席科学家谢耘在中关村创业讲坛上的主题演讲。让辅助人类体能的工具和辅助人类智能的工具,都和人逐步无缝接起来,这就是人工智能的未来。


人类创造的工具分成两大类,一类是辅助体能的工具,计算机其实是作为一个计算的工具辅助人的智能活动。能不能以后代替智能活动,这是很多人梦寐以求的活动,下面我会做一些分析。


因为计算机是辅助智能的一种工具,而且计算本身其实是人的智能活动的一部分。上个世纪40年代计算机诞生之后,整个的产业很快把兴趣从制造能计算的机器,而转向了制造有智能的机器。这件事情的一个标志性的时间,就是在1956年的时候一群来自于神经学、逻辑学、数学计算机等等的牛人,在美国开了两轮会提出了人工智能的概念。


当时人类对造智能的机器还是非常乐观的,这是两个典型的牛人。一个是已经不在世了,叫做Hebert,他1965年讲20年内机器能完成人能做的一切工作。另外一个牛人还在世,叫做Minsky,1970年时讲在3到8年的时间里将得到一台具有人类平均智能的机器,他们在说什么?大家知道前一段美国一台机器在答问题的时候还赢了,还有一台机器通过了图灵测试,他们说的是不是这样的机器?不是,当年讨论人工智能的时候讲的不是我们现在看到的事情。


当机器能完成人能做的一切工作的时候意味着什么?意味着当年科学家想造一台机器,这台机器就和人一样在开始的时候内置了一些机制,但是是很蒙昧状态,什么也不知道。让这台机器和外界的交互能够学习,能够拥有智慧,能够获得知识,这是当年讨论智能时候最原始的想法。


当年认为这种机器花一二十年能造出来,结果是什么?在90年代的时候这个努力遭到了重大的挫折。底下那台是日本造的第五代计算机,1981年开始的,当时引起了全世界的轰动。这台计算机当时日本倾全国之力来造,他们认为从90年代开始人类在人工智能领域已经积累了大量的经验,再经过十年的时间我就能够造出这么一台机器来。这台机器只需要内置基本的机制和人工接口,它就会自己获得智慧和知识,不需要你去编程。到1990年的时候这个项目彻底失败了。


80年代人工神经网络,号称模拟人的大脑神经做一个网络就有智能,当年我做博士就是研究这个问题,在90年前后冷下去了,事实证明并不能达到我们的期望。


所以IT整个产业其实是在90年发生了一次历史性的转折,就是从对智能的追求回归到了对计算能力的追求。发现造一台和人大脑一样的计算机不靠谱。什么靠谱?让计算机越算越快比较靠谱。IT产业今天我们看到的格局是在1990年的时候发生了根本的转折才变成这样的,在那之前对智能的追求是非常热的。


这就是我们看到的今天IT产业在做什么?就是让机器越算越快,把机器越做越小,机器可以把所有的设备都连起来,为什么?就是因为计算机越做越小。计算机核心还是在做计算,但凡能变成计算的问题,计算机都可以解决。


如果一个人没有本事把一个问题变成计算问题的话,计算机就解决不了。刚才中组部的人问我,一个局长能不能当副部长,如果没有人能够把这个问题当作计算问题的话,对不起解决不了,给计算机灌多少数据都没有用,一定有人懂这个事情怎么做计算机才能算。


随着让计算机越算越快,做到今天整个IT产业迎来了第二个关键性的转变,就是在让计算机越算越快的道路上又出现了一个重大的转折,什么转折呢?就是今天基础技术平台在绝大多数的情况下足够富余了,不再成为应用的瓶颈。


所以IT产业从现在开始往未来看,基础技术平台主宰整个产业发展的阶段已经结束了。在90年代买PC会问主频多少,主频不够有的销售商说可以给你升频,为什么?因为计算能力不够。


但是到今天买手机或Pad的时候知道主频是多少吗?没有人关心了,为什么?基础技术平台的能力在绝大多数的情况下已经足够的富裕,不成为应用的限制瓶颈。从今天开始在IT产业里面基础技术平台将不再主宰未来产业的发展,真正主宰未来产业发展的将会是应用。为什么发生这件事情?就是因为集成电路技术的发展导致这个样子。


现在集成电路线宽做到最小22纳米,就是在一个大头针的针头上可以放一亿个晶体管,为什么做这么小已经做成了立体的。原来的晶体管是平面二维的,现在已经是立体的了。


再往下做,集成电路还能做到多小?我和英特尔的人谈过,他们说最小做到2纳米,也是可以在未来十年里再降低一个数量级,十年里硅走到头了,可以再用别的。


IT产业之所以发生第二个转折就是因为集成电路走到了这个程度,在今天开始IT产业真正进入了青年时期,也就是真正开始了黄金时代。在此之前无论IT产业创造了什么样的不可思议的奇迹,那都是序幕。真正的奇迹将会在未来发展,整个IT产业波澜壮阔的前景还刚刚掀开一角。


现在好多人在谈产业替代的问题,就是IT之后谁来驱动社会的发展,我觉得谈论这个话题还太早了,IT产业对于整个社会整个颠覆性的影响刚刚开始。


举一个很简单的例子,《阿凡达》都看过对吧?IT在颠覆一个很传统的产业,就是咱们的电影,可以不用演员了。以前做不到,为什么?因为需要超级计算能力,原来的基础计算能力做不到,它会非常昂贵。现在基础计算能力以后足够富余,我可以完全用电脑把片子做出来,不需要演员了,以后演员可能会失业,这是完全典型的例子。未来IT将会在各个领域里产生今天可能想不到的现象。


另外整个产业的格局不会像今天这样,比如数据库由甲骨文来统治,你只要想做这个东西就要用甲骨文的东西。未来也会散开,散的面会非常之大,在各个领域会有专门独特技术的公司在一个领域里把应用真正做好。


这是我看到未来IT产业的基础,当一个领域的基础技术不再是瓶颈的时候就会真正成熟,汽车产业是这样,航空产业也是这样,比如说波音和空客是做什么的?做应用的,它不是做核心技术的,不生产发动机。空客想造出任何的飞机,发动机公司都能给你配一个合适的发动机,这就是基础技术、核心技术不再构成瓶颈,这个产业在真正繁荣。


IT产业到今天我认为刚刚进入门槛,未来会非常热闹,大家可以好好在这个产业干。


因为这个原因产生了大数据、云计算,大家觉得用了云计算成本可以降低,其实这个话可以倒过来说,因为成本降低了今天才可以用云计算的方式提供这种服务。


云计算本质是产业服务层面的变化,不是有了云计算技术突破了开始搞云计算,而是因为里面的技术和产品不断进步,而导致整个计算资源、通讯资源、存储资源成本大幅度降低了,所以今天才开始搞云计算,这是这个产业真正发展的逻辑。


大数据也是一样,因为无所不在才产生了大数据,就是因为计算资源很便宜了,处理器很便宜了,所以才会产生大量的数据。我一个人带了好几台计算机,现在手机也是一台计算机,现在手机计算机的能力,相比80年花天文数字的投资造出的第一台银河一号巨型计算机的能力快了不止一个量级,今天的计算资源就是如此的丰富,所以产生了云计算和大数据。


大数据引出的是大家对智能的遐想,下面专门讲一下智能,我怎么看智能,包括在大数据环境下未来到底要怎么做。人脑底层是不是计算?这个问题现在没有办法回答。我们不知道人脑最底层的机制是不是计算,但是计算机很简单,计算机最底层的机制就是计算,底层是计算的能力。


往上走有一个中间层,这个中间层是架在计算能力和应用之间的,包括了操作系统、数据库等,本身并不直接是应用,它有一个中间层。在中间层之上才是我们看到的各种各样的应用,大脑是什么样的?大脑最底层是神经元,一个一个神经元连接在一起,现在心理生理学家可以测这些信号,但是说不清楚到底是不是计算,只是可以测一些信号。


大脑再往上还有一层,这一层更说不清楚,在这一层之上是平时的表现,我们会说话、学习,也有各种各样的心理过程,就是所谓的心理学讲的显意识过程,这个过程是可以监测、分析,也可以看到的。


最关键是大脑中间这一层是什么?2009年中央十台放了一个节目讲的是半脑人,孩子一岁的时候得了病,最后医生说他得了脑膜炎,实际说不是,而是他得了癫痫。到了十几岁这个孩子开始犯癫痫病,一直很正常,没有太大的毛病。癫痫犯病的就是抽风,咱们俗话说是羊角风。原来是一年到一年半犯一次,后来间隔越来越短,一两个月犯一次,到十七八岁的时候家长就受不了,带他去医院检测,发现孩子是癫痫。


最有意思的是这个照片,大家能够看到左边的大脑已经萎缩了,看不到了。医生最后就决定给他开颅,干了件什么事呢?把他左边大脑切掉,切掉之后怎么着了呢?这个孩子基本上还是正常的。在从小生病这段时间大脑整个完成了重构,因为大脑左右是分工的,一边管逻辑,一边管形象思维,最关键是右边的运动受左脑控制,左边的运动受右脑控制,所以人中风之后看哪一侧脑袋中风,这一侧脑袋中风,这侧的肢体运动受影响。


但是现在医生把整个大脑的一半切掉之后而没有受影响?这说明什么?说明大脑有中间一层。底下神经原一层出现故障以后,像云计算中心一台机器出现故障云平台重构,保证系统上面的应用可以正常跑,实际上大脑有这样的功能,也就是中间有一层。中间这一层到底是什么?其实到现在神经心理、生理学家都不知道。


为什么讲这件事情?我们今天对智能本质的理解还是非常肤浅的,对于人的大脑中到底在发生什么,对于整个过程的理解是非常肤浅的。包括今天世界上的很多科学家经过了90年代所谓人工智能的冬天,到今天大数据时代又开始蠢蠢欲动,试图构造一个号称是和人一样有聪明、能够学习、能够独立、具有智能的机器。


我听说有一家企业放了一台这样的机器到大学课堂跟着学生去学习,认为还是很有可能造出和人完全有一样智能的机器。我认为这个理想还是非常之遥远,以后能不能造出来我不知道,但是从人类今天对整个自身智能过程理解的局限,我认为我们不足以支撑造出这样的系统。


我们现在能够实现的所谓的智能还是在上面的一层,就是能够观察到、测量到、分析到的人的智能活动。对不起,人的智能活动更重要的是底下这一层,为什么呢?刚才我说了这个孩子刚生下来是蒙昧无知的,脑子里没有任何东西,完全凭着和外界的交互成长起来。但是今天的计算机不行,我们要内置很多的东西。


下面就讲一下人在实现智能的这条路上有几个基本的方法,实际上有三个。第一个是形式上的模仿,刚才我说的是人工神经网络,什么意思呢?我们发现人的神经原是有巨量的神经元,它们之间有大量的连接。从50年代开始搞人工智能的有一批人认为,我也造一些很简单的处理单元,然后把大量的处理单元连接在一起,我觉得就可能会有智能。


这句话听起来有点像开玩笑,大家不要惊喜,科学家经常也搞不靠谱的事情。如果你们仔细读科学史的话,其实科学发展历史上有很多不靠谱的事情,包括很有名的科学家也干很不靠谱的事情,所以大家要记住不要把科学变成一种宗教迷信。


这个事情形式模仿到今天为止,没有产生很了不起的结果,所谓结果就是非线性函数,非线性函数对样本集合按照最小差来拟合的过程,这个几百年就有了,所以形式模仿并没有成果。


真正成功的是后两个,分别是机制模仿和机制替代。什么是机制模仿?我们做一件事情完全是按照人的大脑做事的方式做,比如下棋,比如计算机可以挑战世界冠军,赢了当年俄罗斯的世界冠军,机器怎么下棋?也会推演,因为计算快比人推演的过程很要多,最后把世界冠军赢了。这是通过机制模仿实现特定的活动,前提是要理解这个机制。


第二个是机制代替。这个事情人是怎么做的,我可能不知道。比如说人的视觉,人的视觉过程还是非常复杂的,搞不太清楚视觉过程最后是什么过程。没有关系,我可以用另外一套机制来实现同样的效果,所以手写识别的过程和我们识别汉字是不一样的,我们识别汉字是拿一个汉字来识别。手写识别会把整个写字过程记录下来,利用写字过程的信息和笔划的信息来识别,所以整个机制和我们不太一样,但是效果可以是一样的。


这三个是核心的三个实现智能的方式,后两个是最重要的。


下面是用机制实现智能走了什么样的路,这个和大数据就有关系了。最开始实现智能,人们希望发明一些基本的机制,用这些基本的机制就能使得机器和人一样通过与外界的交互变得聪明,可以来学习,这就是日本第五代计算机典型的思路,但是这种思路后来碰的头破血流,事实证明是不可以。


到了上个世纪七八十年代在对智能追求上,人就退了一步。看来我们没有办法理解人的智能过程最底层的机制是什么,靠这个实现不了。退了一步是什么?就是把人的知识灌到机器里,加上一些机制来实现智能,这就是一种混合的方式。机器其实是预制了人的知识在里面的,这叫什么?这就叫专家系统,这是在上个世纪80年代非常火的。这个时候我们会发现机制和信息结合了,和数据开始结合了,知识也是一种数据、一种信息。


到了今天我们在谈大数据的应用等等,其实是第三步,我们会有一些机制,加上知识,再加上大量的数据去实现目标。这就是人类在追求智能化过程上,用机制来实现智能化过程的演变过程。


最开始仅仅希望找到一些智能的机制,后来发现不行,所以把这些机制加上知识、数据来做。在整个的过程中,对于智能概念在不断的放松、放宽,所以我们今天谈的智能和五六十年代谈的智能其实不完全一样。


因为我们碰壁了,所以把智能放宽了。今天当我们在谈很多智能应用等等东西的时候,其实很多东西在历史上都是有的,比如这些算法或机制,而且在历史上并不把这些东西当作智能的东西,因为那时候对智能的东西要求比较高。只是说后来实现不了,所以这些东西慢慢都变成了智能的东西,融进了智能的概念。


今天我们谈智能的概念还是非常宽泛的概念,容纳了很多传统的东西,也包括现在的东西在里面,这就是整个智能机制实现演变的过程。


到今天我们走了机制+知识的数据年代,回过头来再看一下数据在计算机应用历史上的演变过程,计算机最开始是做数值计算的。数值计算采用的数据是物理量,刚才涂老师讲对外在世界的测量,所以是一种微观的反应局部的物理的数值,这是计算机最开始使用的数据。


后来计算机进入到所谓的在线事务处理、在线交易,比如做银行系统、ERP系统、飞机票务系统,这个时候计算机用的是什么时候?用的是所谓的结构化数据,比单一的数值就复杂了,不再单一的微观数据,我说的是变成了中观的数据。


一个电子机票是最典型的结构化数据,可以用固定的字段来描述所有人的机票,所有人的机票都是这个格式,这就是结构化的数据。这是计算机从五六十年代开始到今天依然是占主流地位的应用,计算机使用的数据在演变,从微观演变到中观,内涵变复杂了。到今天有大量的非结构化数据实现了,比如网上聊天和拍照片等等。


这两个阶段和前两个阶段有非常大的不同,前两个阶段的数据都是和具体的应用绑在一起的,数据服务于应用,应用会需要你必须采集这些数据。但是今天不是,今天大量的数据出现可能没有特定的目的。


比如说拍照,以前觉得这个景点特别好,咱们照一张留个纪念。今年是拿着相机到这里想照一张,到了那里想再照片一般张。大量的数据涌现了,我们不知道有什么意义和价值,所以大家才说我们蒙不能从数据里挖出一些东西用起来。这个是计算机整个数据的变化。


数据和信息我这里已经通用了,我认为比较复杂的是信息,简单的是数据,这一点就不细究了。这里想讲一个很重要的概念,就是今天大家在谈论大数据的时候,绝大多数人都在谈论怎么去用数据。


我这里想讲一下,数据、信息从产生到使用是分了不同阶段。首先有一个生成采集的阶段,然后有存储和传输的阶段,存储、传输之后并不是马上是应用,其实有一个管理的过程,怎么样把信息管起来。信息的存储不等于管理,或者说存储是最粗放的一种管理。但是真正要想对信息用好,其实信息是需要比较复杂的管理,根据这些信息的内容和逻辑真正管起来。甲骨文搞数据库是为了管理数据,真正把信息有效的管理起来。


回过头来再看一下人脑和计算机系统。计算机系统的数据和应用是一一对应的,每一个应用都有自己的数据,所以我们讲计算机今天都是一个信息孤岛。比如银行有自己的数据,银行的应用是用的自己的数据,机票的应用是用的自己的数据,至今各有各的数据,每一个数据都是为一个特定应用准备的,这是今天在计算机应用里面最典型的特征。


我们看一下人脑是不是这样?人脑不是这样。我们脑袋里存储的信息是什么样的?是整体。我们脑袋里并不是说这个信息是为这件事用的,那个信息是为另一个应用用的。带人脑底下有一层统一的信息管理层,所有的信息在人脑是做整体的结构存在在一起的,从人脑的角度看和计算机最大的区别。


当今天的计算机系统也发生了变化,进入了所谓大时代之后,我们要到底怎么管理信息?还是按照原来的方式把数据按照应用管起来,或者它就是一个块,咱们先堆起来再说,用的时候再挖。


我在这儿的建议,后面讲的会是另外一个我提出的思路。大数据在这里想讲一下未来到底有什么样的技术、有什么样的应用模式。我想的也是非常庞杂,会有很多不同的做法,我下面讲的可能只是其中的一个,而不是全部。但是我认为这个做法可能是非常重要的一点,甚至这个做法颠覆整个IT产业,但是它不是万能的,不是一个包治百病的药,有人卖这种药,但是我不卖。


在大数据时代信息到底应该怎么管理?咱们先不谈应用,先谈信息到底应该怎么管理。传统的管理是按照一个一个应用把数据管起来,在大数据时代大量的数据产生的时候是没有明确应用的,或者说也明确的应用,但是这个数据的价值绝不仅仅在于这一点的应用。到底我们应该怎么管这个数据?因为管好数据才能有好数据,如果连管都管不好,谈大数据的应用就有点瞎扯了,或者只能在很浅的层次上用。


我个人一个基本的观点,在这个时代我们应该按照主体、按照人、按照企业、按照城市,按照一个一个主体界定的范围把这些数据管起来。怎么管?按照数据之间、信息之间反映的逻辑,而不是像逻辑一样堆起来。


对于一个个人这个信息应该怎样管?人脑中的信息不是杂乱无章的,信息在脑里也不是一堆垃圾,是有内在逻辑,也是相关的。当我们个人信息要管的时候应该怎么管?我们应该按照这些信息具有的人所感知的么在逻辑,把它组织在一起,最后形成一个什么?形成人脑这一部分的虚拟映像,在计算机里构造出了人脑信息集合的映像,它不是一个仓库,更不是一个垃圾堆。


建这种映像围绕主题把信息管起来,这是非常有挑战的事情。你既要理解信息是什么,信息不是简单的照片,它需要其他的补充信息才能够变得有意义的可以使用。同时还要理解对象是如何理解信息的,这些信息反映了你对象的哪些内在的逻辑关系。这个是我花了三年时间构成的针对个人信息的数学结构。这种方法会在大数据时代和未来IT发展过程中解决一类特定的问题,但是不会解决所有的问题。


说的这些东西可能太玄,用这种方式把信息有效的管起来,在这个基础上构造出应用系统和传统的本质到底有什么区别?这儿给一个智慧城市典型的例子。这是一个智慧城市管理系统,在上面大家可以看到有智慧交通、智慧旅游、城市安全等的管理系统。


传统的IT系统怎么建?比如智慧交通系统会自己采集数据,城市安全系统也会自己采集数据,所以导致一个场所能放多个摄像头在城市里,因为针对的是不同系统。这是非常传统的做法,就是数据和应用紧密的绑定在一起,数据的产生就是为了应用,这个应用也就用这些数据,所以我们抱怨信息孤岛等问题。


反过来如果按照一个城市主体把信息管起来,整个的系统就会变成这样子,最底层是所有的信息采集设备,包括摄像头、传感器,以及包括在网络上的虚拟传感器去监测整个网络的活动。所有的数据采集起来并不是灌到应用让应用去使用数据,而是按照数据所反应的城市各个部分的内在逻辑关系,把它们组织在一起,成为了这个城市在虚拟世界里的一个映像。


这个数据不是一个垃圾堆,这个数据有了内在整体的含义。在这个基础上可以对这个数据做更充分的利用,可以做各种各样的分析、各种各样的模拟。然后上面的应用可以到映像里去获取需要的各种各样的信息,而不是像原来仅仅局限在自己的系统里。


信息的价值用这种方式会被更加充分地挖掘出来,而应用也能获得更加完整丰富的信息,而且上层应用的变化不影响底层。所以这种方式是和传统IT系统建设完全不同的一个方式,我个人认为未来很多IT系统可能会用这种方式来构建,当然不是所有的,也不是所有的信息都用来构建虚拟映像。


但是这会成为一个非常核心的,或者非常重要的一种应用构建的模式,而且这种模式将会对IT产业、IT应用产生重大的影响。它不仅仅会改变应用,而且会产生核心的一些基础的技术、基础的产品、基础的平台,整个IT产业未来的变化可能远远超出我们的想象。


回到个人的例子,如果把个人的应用也按照这种方式来建,底层就是一个个人的虚拟映像,中间是在这个映像基础上融合的服务,界面层可以人更加自然的交互。这个不是解决大脑低层看不到的智能过程,而是用来和我能够感受到、看到大脑的部分想办法无缝地结合起来。


这就是用这种方式构建应用未来出现的场景,计算机和你不仅仅在人机交互界面上,你会觉得计算机用起来很顺手,而且计算机的应用,特别是计算机对信息的存储、管理的方式和你的思维习惯、生活方式,将会很自然地融合在一起。因为这些信息就是按照你的习惯和思维方式组织和管理起来的,这样信息系统和人的接缝更小,最终形成无缝连接。


放到整个网络的世界里是什么景象?在整个网络世界里可能有不同的意义,有不同主体构造出来的核心应用系统,这些应用系统都是以主体的虚拟映像为基础,最后网络世界把它们联结在一起。所以网络世界也将更加变得有序,更加像真实世界的映像,而不是像今天这样杂乱无章。


计算机的应用,无人驾驶汽车也是将汽车和人无缝结合起来,汽车驾驶和个人信息管理系统也会结合起来,信息应用系统和信息控制系统也会无缝连接的。最典型的无缝连接是今年世界杯拿了一个残疾人开球,我没有查到视频。这个是机械手,这个手直接连接人在神经上,完全是由神经控制,这个手已经进入到临床应用阶段了。这个手拿一个葡萄吃,葡萄不会捏碎的。


未来的发展如果总结成一句话,就是让辅助人类体能的工具和辅助人类智能的工具,都和人逐步无缝接起来,这就是我认为智能的未来。而不是说我们造一台机器,让它和我一样,和我同样的智能,最后来挑战我。


我认为这个目标也许几百年有可能能够实现,但是在现在来看未来几十年、上百年的历程往后看的话,我认为智能更多的会按照这个方向去走,而不是造出有独立人格和人完全有同样能力的机器。无论数据有多大,我想这个目标在目前看都很难实现。


我大概花点时间把整个智能的过程的理解跟大家讲一些,都是个人的观点不一定对,供大家参考。而且一定不是包治病的药,只是我认为未来IT产业很重要的主线,而且这条主线将会对整个产业产生很重大的影响。(完)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存